Graphs générés

La table misAct rassemble des charactéristiques calculées sur chacun des graphes générées.

  • nH : nombre de voisins de l’acteur manquant
  • mean.cpH : moyenne des corrélations partielles sortantes de l’acteur manquant
  • mean.vv : nombre moyen de voisins des voisins de l’acteur manquant
  • max.maxDeg : degré maximal parmi les voisins des voisins de l’acteur manquant
  • mean.maxDeg : moyenne des degrés maximaux des voisins de voisins de l’acteur manquant
  • mean.btw : moyenne des betweenness des voisins de l’acteur manquant
  • btwH : betweenness de l’acteur manquant.
nH mean.cpH mean.vv max.maxDeg mean.maxDeg mean.btw btwH
7 -0.3463350 1.285714 4 2.500000 30.50000 69
4 -0.3642767 2.250000 3 2.333333 35.00000 65
11 -0.2899265 1.181818 2 2.000000 35.00000 85
7 -0.3095017 1.857143 2 1.333333 28.33333 79
5 -0.3500979 2.000000 4 2.333333 31.33333 66
4 -0.4105571 1.750000 3 2.000000 36.50000 52

Les résultats sont résumés en regroupant les graphes par l’influence de leur acteur manquant :

  • minor : l’acteur manquant est lié à moins du tiers des noeuds (\(nH<5\))
  • medium : l’acteur manquant est lié à entre le tiers et la moitié des noeuds ( \(5 \leq nH < 7\))
  • major : l’acteur manquant est lié à plus de la moitié des noeuds (\(nH \geq 7\))
influence count
major 214
medium 155
minor 22

Convergence de VEMtree

Tous les VEMtree ont convergé, mais pas de la même manière. L’algo VEMtree a trois critères d’arrêt :

  • W et Omega convergent,
  • la borne inférieure converge,
  • maxIter a été atteint.

Donc VEMtree peut s’être arrêté du fait de la borne inf indépendemment de la convergence sur les paramètres W et Omega. Dans ce qui suit, on voit que maxIter (qui vaut 200) n’a jamais été atteint, et que lorsque c’est la convergence de J qui permet l’arrêt de l’algorithme, Omega a convergé mais pas W.

##        V1        
##  Min.   :  7.00  
##  1st Qu.: 11.00  
##  Median : 14.00  
##  Mean   : 15.72  
##  3rd Qu.: 18.00  
##  Max.   :100.00

Réseau et position de l’acteur manquant

La qualité d’inférence est évaluée avec l’AUC, la PPV (TP/(TP+FP)) et le TPR (TP/(TP+FN)) des arêtes incluant l’acteur manquant, notés PPVH et TPRH. Ces valeurs sont calculées pour chaque graphes, et les proportion de valeurs supérieures à 0.8 sont mises en liens avec le nombre de voisins nH de l’acteur manquant.

influence count med.auc auc.prop50
major 214 1.00 100
medium 155 0.96 100
minor 22 0.89 100
influence count med.ppvh med.tprh ppvh.prop50 tprh.prop50
major 214 1.00 1.0 95.8 95.3
medium 155 0.86 1.0 71.6 74.2
minor 22 0.50 0.5 40.9 45.5

Boxplots

Densities

VEMtree was unable to infer the missing actor in some case of major influence:

## $seed
## [1]  19  42  80 110 135 219 222 307 360

AUC vs PPVH

AUC vs TPRH

PPVH vs TPRH

Reconstruction de l’acteur manquant

La reconstruction de l’acteur manquant est évaluée par la corrélation entre le vecteur latent gaussien d’origine \(Z_H\), et le vecteur des moyennes inférées \(M_H\).

influence med.cor prop50
major 0.84 96.3
medium 0.78 74.8
minor 0.52 54.5

VEMtree was unable to reconstruct missing actor in some major influence cases :

## [1]  19  42  80 110 135 155 222 307

Pourquoi plusieurs groupes

Etude de J, Jcor, Icl et diffJPLN en fonction de AUC, PPVH et corZM

AUC

PPVH

corZM

TPRH

Caractéristiques des graphes

J et Jcor

AUC

PPVH

corZM

TPRH